GÉNOME - Génome nucléaire


GÉNOME - Génome nucléaire
GÉNOME - Génome nucléaire

L’expression génétique dans une cellule procaryote telle que la bactérie Escherichia coli est assurée par des mécanismes couplés de transcription et de traduction [cf. BIOLOGIE MOLÉCULAIRE]. L’enzyme responsable de la transcription, l’ARN polymérase, transcrit en une séquence ribonucléotidique d’ARN messager (mARN) la séquence désoxynucléotidique d’un gène donné, présent sur une molécule d’ADN, à partir d’un site de démarrage spécifique, le promoteur, jusqu’à un site de terminaison, également bien défini. La traduction du mARN ainsi synthétisé débute bien avant que la transcription ne soit terminée. Cette traduction s’effectue grâce à l’intervention d’une machinerie enzymatique complexe faisant intervenir les ribosomes et les ARN de transfert qui apportent les acides aminés qui s’assembleront en polypeptides et constitueront la protéine codée par le gène en activité. Ainsi, les procaryotes possèdent-ils bien un génome constitué par une molécule d’ADN bicaténaire constituant un long filament refermé sur lui-même, de façon circulaire. D’abord désignée par le terme nucléoïde, cette structure porteuse de l’information génétique de l’espèce est plus souvent nommée chromosome, ce qui entraîne un risque de confusion puisque ce pseudochromosome n’est ni inclus dans un noyau, ni constitué de chromatine. Le génome des procaryotes n’est donc pas un génome nucléaire. En revanche, la synthèse de l’ARN s’effectue dans les cellules eucaryotes sur une matrice chromatinienne qui représente, en période interphasique (entre deux divisions cellulaires), les chromosomes présents dans le noyau cellulaire, tandis que sa traduction a lieu au niveau des polyribosomes cytoplasmiques. Le mARN du noyau doit donc franchir, au niveau des pores dont elle est perforée, la membrane nucléaire afin d’atteindre le cytoplasme. Les deux étapes de l’expression génétique, transcription et traduction, sont donc séparées dans l’espace et dans le temps dans les cellules eucaryotes. Ce découplage entre transcription et traduction permet l’existence d’une étape supplémentaire, post-transcriptionnelle, de régulation de l’expression de l’information génétique dans les cellules eucaryotes. Cette étape supplémentaire (qui vaut pour les ARN ribosomiques comme les ARN messagers) est la maturation des transcripts primaires , qui se déroule dans le noyau. La synthèse des mARN est donc un processus beaucoup plus complexe dans les cellules eucaryotes que dans les cellules procaryotes. La portée réelle de cette complexité n’est apparue que grâce aux progrès foudroyants qui ont été réalisés lors des dernières décennies dans la connaissance de la structure et du fonctionnement du génome des cellules eucaryotes.

Comme souvent en science, ces progrès sont intimement liés à la mise en œuvre de nouvelles méthodes qui ont permis de réaliser des expériences qui, jusque-là, paraissaient relever de la pure utopie. L’étude de la structure et de l’expression des gènes dans les cellules eucaryotes présente en effet des difficultés majeures liées à la très grande taille du génome et au grand nombre de gènes exprimés dans une cellule donnée. Ainsi, la masse du génome haploïde humain est de l’ordre de 1,8 憐 1012 daltons d’ADN (environ 500 fois celle du génome d’Escherichia coli ), alors que la masse d’un gène «moyen» peut être estimée à 106 daltons. Tout gène constitue par conséquent une fraction infime de l’ADN cellulaire total, même si le nombre effectif de protéines (sans doute de l’ordre de quelques dizaines de milliers) codées par un génome animal donné est très inférieur au nombre de gènes potentiels. Cette différence s’explique, d’une part, par la structure particulière des gènes eucaryotes (cf. chap.1) et, d’autre part, par l’existence d’ADN «superflu» codant ou non codant formant les séquences répétitives non codantes et les satellites. Ce sont les techniques de manipulation génétique in vitro (appelées aussi techniques d’ADN recombinant in vitro, génie génétique ou ingénierie génétique) qui ont permis d’isoler des segments d’ADN représentant environ un millionième d’un génome animal, puis de les amplifier à volonté et d’en étudier la structure et la fonction. Cette tâche est rendue possible par d’autres méthodes, telles que la dissection du génome à l’aide des enzymes de restriction, la détermination de la séquence de l’ADN des gènes et la préparation de sondes moléculaires permettant de détecter spécifiquement un gène donné et ses produits de transcription. La compréhension des mécanismes sous-tendant la régulation de l’expression génétique au niveau transcriptionnel aura ainsi permis de comprendre maints aspects complexes des organismes eucaryotes, y compris les processus de détermination et de différenciation durant le développement embryonnaire, ainsi que les anomalies qui provoquent l’apparition de cellules tumorales.

1. Gènes en mosaïque codant pour des protéines dans des cellules eucaryotes

La synthèse et le clonage d’ADN bicaténaire complémentaire d’un ARN messager donné (cADN) ont permis l’étude de la structure d’un grand nombre de gènes codant pour des protéines. Tout d’abord, dans un grand nombre de cas, le cADN fournit la sonde moléculaire nécessaire pour cloner le gène correspondant [cf. GÉNIE GÉNÉTIQUE]. Ensuite, c’est la comparaison du cADN et du gène cloné correspondant qui a révélé l’existence d’interruptions dans les séquences d’ADN codant pour les acides aminés de certaines protéines. Enfin, le clonage du cADN est souvent le seul moyen de purifier jusqu’à homogénéité un mARN présent en très faible concentration.

La présence d’interruptions dans une séquence d’ADN codant pour la séquence des acides aminés d’une protéine a été démontrée en premier pour les gènes de la 廓-globine de la souris et du lapin et pour l’ovalbumine de poule, en comparant les cartes physiques, établies à l’aide d’enzymes de restriction [cf. GÉNIE GÉNÉTIQUE] du cADN cloné et du gène correspondant non cloné. Contrairement à ce qui existe dans les cellules procaryotes, il n’y a donc pas dans les cellules eucaryotes identité entre la taille du mARN et celle du gène correspondant (on dit parfois que le principe procaryote de colinéarité entre l’information génétique et son produit n’est pas respecté pour ces gènes eucaryotes). De tels gènes «interrompus» sont qualifiés de gènes en mosaïque (ou encore gènes discontinus ou split genes des Anglo-Saxons), car les séquences d’ADN transcrites en ARN et traduites en protéines sont séparées par des séquences qui n’ont pas de contrepartie dans le mARN. Par définition, les séquences d’ADN dont les transcripts se retrouvent dans le mARN sont appelées exons , tandis que les séquences qui les séparent sont nommées introns . (En réalité, la découverte des gènes en mosaïque dans le génome des cellules eucaryotes a été précédée de quelques mois par la mise en évidence d’une organisation structurale semblable au niveau des génomes de certains virus animaux à ADN – adénovirus et SV40 –, les interruptions décelées étant toutefois situées dans les régions codant pour les séquences non traduites des mARN.)

La figure 1 illustre cette situation dans le cas du gène de l’ovalbumine. Le mARN de l’ovalbumine qui est formé de 1 872 nucléotides plus une chaîne de polyadénylate (poly A) à son extrémité 3 [cf. GÉNÉTIQUE MOLÉCULAIRE] est codé dans l’ADN cellulaire par un gène dont la taille est d’environ 7 700 paires de base. Ce gène possède huit exons, qui codent pour les huit domaines correspondants du mARN. Les huit exons sont séparés par sept introns, de telle sorte que la taille du gène ovalbumine est plus de quatre fois celle du mARN qui assure sa traduction ribosomale. Le clonage du gène ovalbumine a permis de visualiser en microscopie électronique la nature mosaïque du gène ovalbumine. La figure 2 montre une molécule hybride entre le mARN de l’ovalbumine et le brin codant de l’ADN du gène cloné de l’ovalbumine. Les exons du gène forment des régions hybrides (plus épaisses) avec les domaines correspondants du mARN, tandis que les introns du gène qui n’ont pas de contrepartie dans le mARN forment les boucles séparant les régions hybrides.

Les gènes 廓-globines de souris, de lapins et ceux des humains sont constitués de trois exons séparés par deux introns. Il en est de même pour les gènes 見-et 嗀-globines, et il est remarquable que, chez différentes espèces, pour tous les gènes globines la position relative des divers introns et des exons est hautement conservée, autrement dit similaire chez la plupart des espèces qui ont été testées à ce sujet.

Le cas des gènes immunoglobines est instructif à plusieurs égards. Les molécules d’immunoglobulines Ig [cf. IMMUNITÉ ET SYSTÈME IMMUNITAIRE] sont composées de deux types de chaînes polypeptidiques (chaînes légères L et chaînes lourdes H), chacune ayant deux régions distinctes, la région constante (C) et la région variable (V). Les molécules d’Ig sont classées en groupes possédant des régions C identiques. Les régions C des différents groupes sont très différentes dans leurs séquences en acides aminés. Pour un groupe donné, les régions V diffèrent dans les molécules d’Ig présentant des spécificités antigéniques différentes. Comment une région de type C donnée peut-elle être associée à différentes régions V? Quel est le mécanisme responsable de la grande diversité des molécules d’Ig apparues au cours de l’évolution d’une part, et durant la vie d’un individu d’autre part? L’étude de la structure des gènes des immunoglobulines donne un début d’explication à ces phénomènes. Il apparaît en effet que les gènes V (qui possèdent un intron) et C sont éloignés dans le génome de l’embryon, mais rapprochés dans le lymphocyte différencié à la suite d’un réarrangement génomique qui amène à proximité les régions géniques V et C. Toutefois, les gènes V et C, bien que rapprochés, restent séparés par un intron, tandis que la région V conserve son intron initial. Ainsi, dans le cas des chaînes légères, les gènes Ig fonctionnels sont-ils formés de trois exons séparés par deux introns. Par conséquent, non seulement les gènes codant pour les Ig dans les lymphocytes différenciés sont discontinus (en mosaïque), mais ils résultent de réarrangements qui se produisent durant la différenciation des cellules produisant les anticorps. Étant donné que pour un groupe donné, caractérisé par un gène C spécifique, il existe plusieurs gènes V différents, de tels réarrangements expliquent comment une même région C peut être associée à différentes régions V et rendent compte, pour une part du moins, de la génération d’un grand nombre de molécules d’Ig variables dans leur portion V, mais constantes dans leur portion C (cette multiplicité des anticorps possibles est encore accrue par la présence d’une troisième région J, qui est elle-même variable pour un groupe donné, et qui peut être associée pour une région C donnée à l’une quelconque des régions V). Ainsi, le système immunitaire offre un exemple de phénomène de différenciation lié à des réarrangements structuraux au niveau du génome. Il est toutefois important de noter que de tels réarrangements, liés à des phénomènes de différenciation, sont plutôt l’exception que la règle, car les gènes globines, comme celui de l’ovalbumine et ceux des autres gènes qui ont été étudiés, présentent la même structure dans les cellules embryonnaires et dans les cellules différenciées fabriquant la protéine spécifique. Leur expression est donc fonction du contexte, ce qui implique l’idée de leur activation (cf. RÉGULATIONS BIOCHIMIQUES - Régulation génétique).

Bien que, en dehors des exemples déjà mentionnés, beaucoup de gènes eucaryotes codant pour des protéines présentent une structure en mosaïque (c’est le cas des gènes de l’ovomucoïde, de l’ovotransferrine et du lysozyme de poule, de la fibroïne de Bombyx mori , de la vitellogénine de Xenopus laevis , de la dihydrofolate réductase et de l’aspartate transcarbamylase murines), il existe des gènes à structure continue . C’est le cas, par exemple, des gènes codant pour le cytochrome C de levure.

Si la transcription d’un gène en mosaïque ne pose pas de problème particulier et peut s’effectuer selon des modalités semblables à celles que l’on connaît pour les gènes ininterrompus des cellules procaryotes [cf. BIOLOGIE MOLÉCULAIRE], il en est tout autrement pour les étapes suivantes de l’expression génétique. En effet, alors que le produit primaire de transcription (transcript primaire) d’un gène ininterrompu est (selon une première approximation du moins) directement fonctionnel, celui d’un gène en mosaïque devra subir des remaniements importants qui élimineront du transcript primaire les régions non fonctionnelles. Ce processus d’«élimination» est appelé maturation et consiste à découper les transcripts d’introns et à coller simultanément les transcripts d’exons pour, dans le cas d’un mARN par exemple, mettre en continuité correcte les séquences codant pour les acides aminés de la protéine. La maturation d’un transcript primaire comporte donc une série d’étapes d’excision-encollage (splicing des Anglo-Saxons), analogues à celles que l’on effectue lors du montage d’un film, qui aboutiront à la synthèse de l’ARN définitif fonctionnel.

La preuve expérimentale d’un tel mécanisme a été apportée dans le cas des gènes globines et ovalbumines. La figure 3 représente une photographie en microscopie électronique d’un hybride moléculaire entre le brin codant du gène de l’ovalbumine et un intermédiaire de maturation du mARN ovalbumine. La comparaison avec la figure 2 montre que les transcripts des introns B, C, D et G ont déjà été excisés, et les transcripts d’exons 1, 2, 3, 4 et 6, 7 encollés, tandis que les transcripts des introns E et F sont encore présents dans cet intermédiaire de maturation séparant les transcripts des exons 4 et 5 d’une part, et 5 et 6 d’autre part (incidemment, cette photographie indique également que l’ordre d’excision des transcripts d’introns ne suit pas nécessairement celui de leur transcription, qui se fait de l’extrémité 5 vers l’extrémité 3 ). Par ailleurs, le processus de maturation ne paraît pas démarrer avant que la transcription soit terminée et que le polyadénylate (poly A) terminal ait été ajouté à l’extrémité 3 du transcript primaire.

Les mécanismes de l’excision-épissage sont complexes; ils sont analysés dans le paragraphe 2 Expression des gènes , dans l’article GÉNÉTIQUE MOLÉCULAIRE, auquel voudra bien se référer le lecteur.

2. Origine des gènes en mosaïque

Quand les gènes en mosaïque sont-ils apparus? Deux points de vue très différents ont été proposés selon qu’on admet que les premiers gènes présents au moment de l’émergence des cellules eucaryotes étaient continus, comme ils le sont aujourd’hui dans les cellules procaryotes, ou qu’au contraire ils possédaient déjà une structure en mosaïque. Dans le premier cas, l’apparition des gènes en mosaïque est liée, au cours de l’évolution des cellules eucaryotes, à l’insertion de segments d’ADN (analogues aux transposons des cellules procaryotes) à l’intérieur de gènes jusqu’alors continus; dans cette hypothèse, l’ancêtre des cellules eucaryotes est une cellule procaryote dont le génome est organisé comme celui des organismes procaryotes actuels, et l’insertion de segments d’ADN est une nécessité pour l’apparition de systèmes de contrôle plus élaborés que les systèmes préexistants. Dans le second cas, les différents segments d’ADN «signifiants», qui, dans un gène eucaryote en mosaïque, codent pour les séquences du mARN, ont été «recrutés» plus ou moins par chance, très tôt au cours de l’évolution, au sein d’une unité de transcription qui, dès l’origine, contient les différents segments d’ADN nécessaires pour coder la protéine, séparés les uns des autres par des séquences sans signification codante. Dans ce cas, l’ancêtre des cellules eucaryotes n’est pas une cellule dont le génome est organisé comme celui des organismes procaryotes actuels, mais un organisme procaryote dont les gènes possédaient une structure en mosaïque. Dans le premier cas, l’enzyme d’excision-encollage est apparue secondairement, et son apparition a conditionné l’émergence des cellules eucaryotes; dans la seconde hypothèse, l’enzyme d’excision-encollage était déjà présente, bien avant l’émergence des organismes eucaryotes, dans un organisme procaryote primitif tel que ces archaebactéries des milieux hydrothermaux, à partir desquelles les cellules procaryotes et eucaryotes actuelles auraient évolué indépendamment, selon la théorie de Carl Woese [cf. ARCHAEBACTÉRIES].

Il n’est évidemment pas possible de prouver de façon indubitable l’une ou l’autre de ces deux théories de l’évolution des génomes des cellule eucaryotes, mais rien ne s’oppose à la théorie d’une absence de filiation entre organismes eucaryote et procaryote actuels. Quoi qu’il en soit, il est d’ores et déjà clair que les gènes ancêtres des gènes en mosaïque étudiés jusqu’à présent étaient déjà eux-mêmes interrompus. Ainsi les gènes 見-et 廓-globines qui ont divergé il y a environ 500 millions d’années ont-ils la même structure en mosaïque, ce qui exclut qu’ils aient pu apparaître par insertion d’ADN dans deux gènes ininterrompus qui auraient été formés par duplication d’un gène ancêtre, lui-même ininterrompu. Clairement, dans ce cas, l’ancêtre des gènes 見-et 廓-globines, qui existait il y a plus de 500 millions d’années, était déjà interrompu aux mêmes endroits. De la même façon, le gène de l’ovalbumine et deux gènes voisins ont évolué par triplication d’un gène ancêtre qui avait déjà une structure en mosaïque identique. Plus généralement, il est certain que l’insertion d’ADN dans la partie codante d’un gène est un événement très rare (qui ne s’est pas produit pendant plus de 500 millions d’années pour les gènes globines) et que la plupart des gènes actuellement en mosaïque ont émergé par duplication de gènes déjà interrompus.

Comment alors expliquer l’origine dans les cellules eucaryotes de gènes continus? Il faudrait évidemment, dans cette optique, la rechercher dans l’élimination des introns originels. Seule une étude détaillée de la structure d’un gène donné le long de l’échelle phylogénétique permettra de dire si un tel événement est possible et quelle est sa fréquence. À cet égard, il est intéressant de remarquer que si pour des gènes qui ont évolué par duplication d’un même gène ancêtre il y a conservation absolue de la longueur des exons, il y a des variations importantes de la taille des introns, ce qui indique que des remaniements très importants sont en tout cas possibles à leur niveau.

En quoi l’existence des gènes en mosaïque peut-elle accélérer l’évolution des cellules eucaryotes? En théorie du moins, de plusieurs façons. D’abord, en permettant de juxtaposer au niveau de l’ARN une information dispersée au niveau de l’ADN et pouvant coder pour les différents domaines d’une même protéine ou jouer un rôle fonctionnel non codant dans la maturation ou la traduction du mARN. Une telle information pourrait avoir surgi au hasard dans une même région du génome ou avoir été regroupée par des événements de recombinaison à partir d’informations codant pour différents peptides, peut-être déjà fonctionnels par eux-mêmes, mais qui, assemblés dans une même unité de transcription, pourraient constituer les domaines d’une nouvelle protéine possédant de nouvelles fonctions. L’avantage d’un système enzymatique d’excision-encollage au niveau de l’ARN est évident: il permet de créer le mARN fonctionnel sans attendre que l’information au niveau de l’ADN soit regroupée en un seul morceau par le simple jeu de recombinaisons ou (et) délétions. De la même façon, la duplication d’un gène initial suivie de la fusion des deux unités de transcription ainsi créées et de la création des signaux d’excision-encollage permettra l’apparition d’une nouvelle protéine de poids moléculaire double, sans exiger que la duplication du gène initial implique seulement les séquences d’ADN codant pour les acides aminés, à l’exclusion de toute séquence adjacente. Qu’un tel mécanisme ne soit pas seulement une hypothèse d’école est attesté par l’étude de la structure du gène codant pour la partie constante (C) des chaînes lourdes d’immunoglobulines, gène composé de trois exons séparés par deux introns et qui a évolué très probablement par triplication d’un gène ancêtre. Finalement, on peut imaginer que, en assortissant différemment les exons d’un gène donné, on puisse synthétiser différents mARN à partir d’une même région du génome. De même, on peut supposer que, en transformant une partie d’un exon en un intron ou inversement, on pourrait, à partir d’une même région du génome, synthétiser différents mARN par le jeu du phénomène dit «épissage alternatif» [cf. GÉNÉTIQUE MOLÉCULAIRE]. Dans le cas des virus à ADN (tels que l’adénovirus-2 et le virus simien 40-SV40) notamment, il a été clairement démontré qu’une même région du génome peut coder pour différents mARN grâce au déplacement des frontières respectives des exons et introns. De tels mécanismes peuvent aussi être utilisés par les cellules eucaryotes, en fonction du degré de développement de l’organisme où elles sont présentes, et aussi selon leur degré de différenciation. Ces faits sont d’un intérêt majeur pour l’élucidation de la signification fonctionnelle et évolutive de l’organisation des gènes en mosaïque

3. Le problème de l’ADN «superflu»

L’ADN chromosomique des eucaryotes est loin d’être seulement un enchaînement de gènes, car il ne sert que partiellement à produire des mARN.

La majeure partie de cet ADN constitue les intervalles entre les gènes et restera sans traduction protéique: c’est un ADN non codant. Pareillement, les introns des gènes en mosaïque sont en définitive, pour la plupart (voir les exceptions dans l’article GÉNÉTIQUE MOLÉCULAIRE), «intraduisibles» puisqu’ils sont victimes des processus d’excision-épissage aboutissant à la maturation des ARN messagers qui permettra la traduction ribosomale d’un message «lisible en continu». En outre, il existe bien souvent des gènes «copies multiples», lesquels constituent donc un ADN redondant.

L’exemple du gène de la 廓-globine (polypeptide constitutif, avec le polypeptide 見 de la molécule d’hémoglobine) illustre à la fois le phénomène des répétitions géniques et celui de l’ADN intraduisible. Il existe en effet cinq gènes de 廓-globine – légèrement différents il est vrai – que séparent, sur le chromosome qui les porte, des intervalles non codants (dont certains représentent des «pseudogènes» 祥廓1 et 祥廓2).

Au total, cet ensemble couvre sur l’ADN chromosomique une longueur que S. Weissmann a évaluée à 80 000 paires de bases nucléotidiques. Or les exons des gènes de 廓-globine fonctionnels en représentent moins de 3 000, soit 600 pour chacun d’entre eux dans la famille cinq fois redondante qu’ils constituent.

Dans l’ADN non codant se trouvent de singulières séquences, répétées des milliers, et même des centaines de milliers de fois: jusqu’a 50 p. 100 de l’ADN humain est ainsi formé de séquences répétées non codantes, dont plusieurs familles ont été individualisées: la séquence dite Alu, par exemple, couvre jusqu’a 2 p. 100 du génome.

Certaines de ces séquences répétées sont des transposons qui peuvent être transférés d’un point à l’autre du génome, provoquant ainsi des réarrangements séquentiels dans l’ADN de façon inopinée.

D’autres éléments génétiques mobiles sont en réalité d’origine virale, donc étrangère au génome spécifique proprement dit. Les provirus intégrés que l’on peut détecter dans le génome des vertébrés proviennent de rétrovirus. Ils se sont introduits par un mécanisme que l’exemple du virus du sida, le V.I.H., a fait connaître: synthèse, sous l’action d’une transcriptase inverse, d’un ADN complémentaire de l’ARN viral, c’est-à-dire d’un fragment de cADN qui viendra se loger dans le génome de la cellule hôte.

Que les séquences répétées de cette catégorie soient des parasites, éventuellement inoffensifs, du génome proprement dit est l’hypothèse la plus facile à admettre. Elle a entraîné la controverse de l’ADN «égoïste» dans les années 1980. Cependant, on n’a pas encore élucidé le rôle éventuel de l’ADN satellite: courtes séquences, longues de quelques nucléotides, répétées en tandem des centaines de milliers de fois, dont l’intérêt pratique s’est révélé essentiel à partir du moment où elles ont permis de différencier les fragments d’ADN analysés en vue de la cartographie génétique humaine (cf. HOMME - Génome humain). Aux séquences Alu, en revanche, a été attribuée l’éventualité d’un rôle en tant qu’origine de réplication de l’ADN chromosomique, mais d’autres fonctions leur ont été aussi assignées [cf. GÉNÉTIQUE MOLÉCULAIRE].

En ce qui concerne les familles multigéniques, deux possibilités expliquent leur présence. Dans le cas où les gènes ne sont pas franchement répétitifs (cas des gènes de la 廓-globine), cela permet la production de polypeptides légèrement différents, utilisables les uns après les autres au cours du développement de l’organisme. Si, au contraire, comme c’est le cas pour les familles multigéniques qui codent pour les ARN ribosomaux, les gènes sont vraiment répétitifs, ce fait aurait l’avantage d’intensifier la production des transcrits, en multipliant les sites de leur fabrication.

En définitive, pour reprendre l’expression de Gabriel Gachelin, le tableau que nous offre le génome eucaryote est «celui de gènes (ADN codant), en quelque sorte perdus sur une toile de fond d’ADN non codant». Et il ajoute, «dans la mesure où les génomes contiennent tant d’ADN non codant, nombre de mutations doivent toucher le décor des gènes plutôt que les gènes eux-mêmes. Que ces mutations soient purement aléatoires ou qu’elles obéissent à une sorte de dynamique interne, le décor varie plus vite que les acteurs que sont les gènes. Peut-être l’accumulation de ces mutations, au terme d’un long et obscur travail évolutif qui modifie le décor d’ADN non codant, prépare-t-elle l’émergence d’autres mutations qui subiront, elles, l’épreuve de la sélection naturelle. La génétique moléculaire, à ce stade, ne peut guère aider la biologie de l’évolution, sauf par cette interrogation provocante: les modifications des génomes les plus significatives sur le plan évolutif ne seraient-elles pas celles qui, initialement, échappent à toute sélection?».

Elles y échappent en effet parce qu’elles touchent l’ADN «superflu», apparemment non fonctionnel, mais qui ne peut être considéré comme évolutivement neutre. D’abord, parce qu’il joue un rôle évident dans les contraintes structurales qui s’exercent au sein du génome. Ensuite, parce qu’il est propice à une variation échappant au crible de la sélection naturelle. Cette variation peut opérer par des mécanismes de modification génétique qui échappent à la règle de réciprocité mendélienne de recombinaison: crossing over inégal, conversion génique et finalement transfert orienté de matériel génétique permettant une certaine forme d’évolution, dite concertée parce qu’elle répond à l’organisation même du génome.

Encyclopédie Universelle. 2012.